首页> 外文OA文献 >Text Segmentation Based on Similarity between Words
【2h】

Text Segmentation Based on Similarity between Words

机译:基于词语相似度的文本分割

摘要

This paper proposes a new indicator of text structure, called the lexicalcohesion profile (LCP), which locates segment boundaries in a text. A textsegment is a coherent scene; the words in a segment are linked together vialexical cohesion relations. LCP records mutual similarity of words in asequence of text. The similarity of words, which represents their cohesiveness,is computed using a semantic network. Comparison with the text segments markedby a number of subjects shows that LCP closely correlates with the humanjudgments. LCP may provide valuable information for resolving anaphora andellipsis.
机译:本文提出了一种新的文本结构指示符,称为词汇内聚剖析(LCP),它可以在文本中定位段边界。文本段是一个连贯的场景;段中的单词通过词汇衔接关系链接在一起。 LCP以文本的顺序记录单词的相互相似性。使用语义网络来计算代表单词衔接性的单词相似度。与许多主题标记的文本段的比较表明,LCP与人的判断力密切相关。 LCP可能为解决回指和省略提供有价值的信息。

著录项

  • 作者

    Kozima, Hideki;

  • 作者单位
  • 年度 1996
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"English","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号